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摘要 : [目的 /意义 ] Springer Nature SciGraph 平台 提供 的 关联 开放 数据 的 分 析 ， 为 国内 出 版 商 在 学 
术 交 流 和 语义 出 版 中 使 用 关联 数据 促进 科研 的 关联 开放 实践 提供 参考 ， 可 推动 我 国 开放 科研 运动 的 进一步 
向 前 发 展 。 [方法 /过 程 ] 对 Springer Nature SciGraph 平台 发 布 的 实体 对 象 、 采 用 的 词 表 、 数 据 模 型 进行 
详细 分 析 。[ 结果 / 结论 ] Springer Nature SciGraph 通过 构建 自己 的 本 体 ， 采 用 一 种 用 于 RDF 的 更 简单 的 
序列 化 N-Triples 格式 的 三 元 组 对 数据 进行 表示 ， 作 为 世界 上 最 大 的 出 版 商 之 一 ，Springer Nature 关联 数据 
在 今后 必 将 为 其 他 出 版 商 要 实现 科研 关联 开放 提供 一 定 的 借鉴 。 
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@@ 引 言 

关联 数据 作为 一 种 最 佳 的 语义 网 实践 ， 从 
2006 年 提出 至 今 十 多 年 的 时 间 ， 经历 了 从 最 
简单 的 知识 库 与 词汇 表 到 不 用 领域 的 应 用 。L. 
Jens、A. S6ren、C. Sarven 等 在 2017 年 第 10 
届 LDOW (Linked data on the Web) 会 议 上 对 
关联 数据 在 过 去 十 年 的 的 发 展 进行 了 总 结 ， 并 
指出 在 未 来 的 十 年 ， 关 联 数据 在 学 术 交 流 中 将 
发 挥 较 大 的 作用 丫 ， 且 此 次 会 议 提出 “开创 关 
联 开 放 科 人 研 知识 云 (pioneering the linked open 
research cloud ) ”外 的 新 型 倡议 ， 鼓 励 学 者 将 


4 


关联 数据 技术 与 最 佳 实践 应 用 于 学 术 交 流 中 。 

C. Sarven 等 提出 关联 开放 原则 (linked research 
priciple ) 以 鼓励 关联 科研 知识 的 开放 外。Schol- 
arlyData.org" 利用 会 议 本 体 数 据 模型 中 对 语 
义 网 会 议 相 关 的 论文 、 人 员 、 组 织 和 事件 进行 
了 组 织 。 欧 盟 、 美 国政 府 和 澳大利亚 政府 等 在 
2013 年 成 立国 际 研 究 数据 联盟 ( Research Data 
Alliance ) 由， 利用 数据 标准 和 实践 促进 科研 数 
据 的 共享 与 交换 ， 通 过 科研 数据 转换 平台 (re- 
search data switchboard ) 与 科研 图 谱 (research 
graph ) 项 目 实现 了 连接 科研 人 员 、 出 版 物 、 研 


基金 项 目 : 本 文系 中 国 科学 院 文 献 情报 能 力 建设 专项 “中 国 科 学 院 知 识 资 产 存 缴 管 理 中 心 建设 ”项 目 ( 项 目 编 号 : 


Y6ZG421001) 研究 成 果 之 一 。 


作者 简介 : 白 林 林 (ORCID: 0000-0003-2265-7399)， 博 士 研究 生 ，E-mail: bailinlin@mail.las.ac.cn; 祝 忠 明 
(ORCID: 0000-0002-2365-3050) ， 信 息 系统 部 主任 ， 研 究 员 。 


收 稿 日 期 : 2017-09-15 发 表 日 期 : 2018-01-15 


^ 


本 文责 任 编辑 : 易 飞 


202310.03077v1 


chinaXiv 


究 资 助 和 研究 数据 集 ( 人 研究 数据 ) 的 功能 。 
Springer Nature 为 帮助 科研 共同 体 充 分 利用 开放 
科研 所 带 来 的 便利 ， 新 推出 SciGraph 关联 开放 
数据 平台 中 ,集成 了 Springer Nature 及 其 合作 伙 
伴 的 数据 资源 ， 如 有 关 科研 资助 机 构 、 科 研 项 
目 及 拨款 、 会 议 、 科 研 单位 和 出 版 物 的 信息 ， 让 
分 析 Springer Nature 出 版 物 的 相关 信息 变 得 更 
加 上 容易， 目前， 该 平台 包含 了 1.55 亿 条 学 术 界 
关注 对 象 的 信息 (三 元 组 ) 。 更 多 的 数据 ， 如 
引用 、 专 利 、 临 床 试验 和 使 用 数量 等 ， 也 将 分 
阶段 推出 ， 这 样 到 2017 年 底 ，Springer Nature 
SciGraph 的 三 元 组 数量 将 增 至 10 亿 条 以 上 5 。 
本 文 以 Springer Nature SciGraph 平台 提供 
的 关联 开放 数据 为 研究 对 象 ， 对 其 发 布 的 实体 
对 象 .采用 的 本 体 和 词 表 、 数 据 模型 进行 分 析 , 旨 
在 为 国内 在 学 术 交 流 和 开放 科研 中 使 用 关联 数 
据 提供 参考 ， 促 进 国内 科研 数据 的 语义 化 、 国 
际 化 共享 和 开放 科研 运动 的 进一步 向 前 发 展 。 


@ Springer Nature SciGraph 的 实体 
LEA 
Springer Nature 的 关联 开放 数据 中 分 了 主体 
(agent) 、 资 产 (asset) 、 概 念 (concept) 、 事 
fF Cevent) 四 大 类 ， 其 中 概念 和 事件 类 中 包括 
的 实体 是 Springer Nature 发 布 的 重点 。 概 念 的 
下 一 层 分 类 包括 : 注释 、 合同 、 出 版 物 、 类 型 , 注 
释 的 子 类 主要 是 引文 计量 类 ,合同 的 子 类 是 资 
助 类 ， 出 版 物 的 子 类 包括 产品 (产品 指 Springer 
Nature 对 外 提供 的 文章 、 图 书 、 书 的 章节 、 期 
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刊 ) 和 作品 ( 专著、 连续 出 版 物 ) ， 类 型 包括 
主题 、 获 取 类 型 、 文 草 类 型 、 会 议 系 列 、 产 品 
市 场 编 号 、 出 版 物 状 态 子 类 。 事 件 的 下 一 层 分 
类 包括 : 隶属 机 构 .聚合 事件 、 注 释 事 件 、 会 议 、 贡 
献 者 、 出 版 事件 趾 。 事物 (thing ) 类 是 所 有 类 
的 上 位 类 。 

在 发 布 关联 数据 之 前 ， 需 要 明确 竺 发 布 的 
数据 中 实体 类 型 及 实体 间 的 关系 。 遵 循 关 联 数 
据 发 布 原则 第 一 条 ， 即 用 URI 作 为 任何 资源 
的 名 称 ， 确 保 资源 的 可 获取 性 。Springer Na- 
tureSciGraph 的 URI 主要 有 两 种 模式 : 

http://www.springernature.com/scigraph/ 
things/(datasets)/ (scigraphld] 


http://www.springernature.com/scigraph/ 
things/(datasets]/ (topic) 
这 两 种 模式 是 一 样 的 ， 第 二 种 模式 主要 
是 针对 主题 类 实体 对 象 的 。 首 先 以 http://www. 
springernature.com/scigraph/ 作为 基地 址 ， 该 地 
址 作为 Springer NatureSciGraph 关联 开放 数据 
的 发 布 平 台 。“thing” 类 是 所 有 类 的 上 位 类 。 
“datasets” 为 各 类 实体 组 成 的 数据 集 ， 其 属 
性 值 可 以 有 articles, grants, journals, journal- 
brands, subjects, contributions, books 等 ， 必 
须 指 定数 据 集 才 能 访问 其 中 的 对 象 。 对 象 集 后 
必须 有 相应 的 对 象 ，URI 中 用 “scigraphId” 或 
“topic” 表 示 ， 和 否则 无 法 找到 对 象 。 
目前 Springer Nature 已 发 布 的 关联 开放 数 
据 中 实体 类 型 有 文章 、 期 刊 、 主 题 、 资 助 ， 各 
数据 对 应 的 URI 如 表 1 Bron: 


表 1 实体 对 象 的 URI 


实体 对 象 


URI 


article (文章 ) 
journal ( 期 刊 ) 


概念 
subject ( 主题 ) 
grant ( 资助 ) 
具体 实例 如 : 


主 题 URI: http:/www.springernature.com/ 


http://www.springernature.com/scigraph/things/articles/ (scigraphId] 
http://www.springernature.com/scigraph/things/journals/ [scigraphld ; 
http://www.springernature.com/scigraph/things/subjects/ {topic} 


http://www.springernature.com/scigraph/things/grants/ [scigraphld) 


scigraph/things/subjects/geology ( 在 Springer Na- 
ture 中 的 主题 词 geology ) 
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期 T] URI: http;//www.springernature.com/ 
scigraph/things/journals/042783d5f9e6e3813522b5 
ebbe89f4ab 

Springer Nature 不 仅 为 数据 建立 了 有 效 、 唯 
一 的 URI， 还 建立 了 一 个 SciGraphcore ontology 

(HR: sg) 本 体 ， 这 个 本 体 由 45 个 类 和 206 
个 属性 组 成 ， 拥 有 自己 的 命名 空间 ( http:/www. 
springernature.com/scigraph/ontologies/core/， 前 
ZB sg :)。 在 概念 上 ， 这 个 本 体 是 以 前 的 nature. 
com 核心 本 体 '" 的 延伸 。 构 建 这 个 本 体 的 原 
因 一 是 由 于 在 其 他 本 体 或 词汇 表 中 找 不 到 相应 
的 词汇 来 描述 某 些 数据 或 属性 ， 二 是 符合 本 模 
型 特色 的 类 和 属性 ， 可 以 使 Springer Nature 在 
更 好 描述 数据 的 同时 被 外 界 更 好 地 引用 。 并 与 
外 部 的 全 球 研 究 标 识 符 数据 库 ( Global research 
identifier database, GRID ) 路 、 澳 大 利 亚 与 新 西 
兰 标准 研究 分 类 法 : 研究 领域 (Australian and 
New Zealand standard research classification: fields 
of research, ANZSRC-FOR ) '?, DOI?! 建立 了 
链接 。 

澳大利亚 与 新 西 兰 标准 研究 分 类 法 : 研究 
领域 ( ANZSRC-FOR ) 是 根据 研发 过 程 中 所 用 
的 方法 对 研发 活动 进行 分 类 ， 而 不 是 根据 研发 
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单位 或 者 研发 目的 进行 分 类 。ANZSRC-FOR 分 
类 法 中 的 类 别 包括 由 企业 、 大 学 、 高 等 学 校 、 
立 科研 机 构 和 其 他 组 织 研究 探讨 的 主要 研究 领 
域 及 相关 子 领 域 和 新 型 领域 。 

全 球 人 研究 标识 符 数 据 JE (Global re- 
search identifier database, GRID) 不 fX 提 
EA 2e 2H 2H 89 ID 和 名 称 ， 而 且 提 供 了 数据 
类 型 、 等 级 结构 、 所 处 位 置 等 元 数据 ， 与 
GeoNames, WikiData, CrossRef, JT JJ Xt Hj 
注册 表 、 国 际 标准 名 称 标 识 符 international 
standard name identifier ，ISNI ) 等 实现 链接 ， 扩 
充 了 元 数据 。 


@ Springer Nature SciGraph 词 表 


关联 数据 的 发 布 原则 第 三 条 是 尽 可 能 复 
用 已 有 的 、 成 熟 的 词 表 来 描述 资源 ， 用 以 提高 
词汇 表 的 互 操作 性 ,减少 对 本 地 词汇 的 管理 。 
Springer Nature SciGraph 所 用 的 词汇 表 主 要 分 为 
通用 词 表 和 专用 词 表 两 类 ( 见 表 2) ， 其 中 通用 
词汇 表 主 要 用 于 描述 实体 的 一 般 属性 ， 如 实体 
类 型 、 实 体 类 型 之 间 的 关系 等 ;专用 词 表 用 以 
描述 具体 实体 ， 并 具有 所 描述 实体 的 属性 。 可 
看 出 ，Springer NatureSciGraph 用 复 用 通用 的 


表 2 词 表 及 注释 


词 表 注释 
OWL ( Web ontology language ) 网 络 本 体 语 言 ， 用 以 在 万 维 网 中 发 布 和 共享 本 体 
RDF ( resource description framework ) ciun 一 种 通过 “ 主 - 谓 - EU 三 元 组 形式 描述 
Web 资源 的 标记 语言 
d NA "EMHEGW Xo > " "T" 
RDFS ( resource description framework schema ) eu 汇 表 的 扩展 词汇 表 ， 为 RDF 数据 提供 数据 奸 
AR Determs (DCMI metadata terms ) MEM PEIRHE Set ENER 


DC ( Dublin core ) 


Vann ( a vocabulary for annotating 
vocabulary descriptions ) 


VoID ( vocabulary of interlinked datasets ) 


1j SKOS ( simple knowledge organization System) 


词 表 sg ( SciGraph Core Ontology ) 


都 


通 


用 


用 


Springer Nature 


柏林 词汇 表 
过 用 例 和 使 用 说 明 注释 词汇 ， 描 述 进行 注释 的 词汇 表 
以 对 RDF 数据 的 元 数据 进行 描述 


以 对 受 控 词 表 中 词汇 进行 描述 的 知识 组 织 系统 词汇 表 
自己 构建 的 本 体 ， 用 以 描述 Springer Na- 


ture 网 站 提供 的 资源 
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词汇 表 来 描述 实体 的 类 型 、RDF 数据 的 元 数据 

( VoID'? ) 、 注 释 所 用 的 词汇 等 ,使 用 的 专用 
词汇 表 只 有 SKOS 和 自 建 的 本 体 SciGraph Core 
Ontology， 并 未 复 用 其 他 词汇 表 对 资源 进行 描 


述 ， 但 是 Springer Nature 提供 了 与 bibo, crm 
) 061 


(conceptual reference model . depe- 


dial” , depedia —owl , dc , dcterms , event , fabio( the 


us 


FRBR-aligned bibliographic ontology ) 


) 1, obo 


foaf, mesh ( medical subject headings 

(open biomedical ontologies ) P”, prism ( pub- 
lishing requirements for industry standard meta- 
data ) P", 
grated semantic framework )  , wd ( wikidata ) "^! 


本 体 之 间 的 映射 ， 其 中 与 dbpedia、mesh 、wd 
是 主题 词 之 间 的 映射 ， 其 他 是 类 和 属性 之 间 的 


ev . . 
schema, skos, vcard"", vivo ( inte- 


Springer Nature SciGraph 


A Linked Open Data platform for the scholarty domain 


~ Digital Science; 


has funded 
publication 


has funding 


organization has field-of- 
has recipient research code 
organization 


Springer Nat 


0 
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映射 。 

可 以 看 出 ，SciGraph Core Ontology 所 描 
述 类 和 属性 比较 全 面 ， 虽然 未 复 用 已 有 成 熟 词 
K, 但 是 使 用 根据 自身 需求 建立 的 本 体 可 以 更 
准确 地 描述 相关 的 类 和 属性 。 


© Springer Nature SciGraph 数据 模 
型 分 析 


目前 Springer Nature 发 布 的 关联 开放 数据 


中 实体 类 型 有 文章 、 期 刊 、 主 题 、 资 助 者 ， 这 
些 数据 之 间 的 关系 模型 见 图 100, xc deo d 


sg:hasSubject 分 别 与 期 刊 和 主题 
进行 链接 ， 资 助 实体 通过 sg:hasFundedPublica- 
tion 与 文章 进行 链接 ， 见 图 2。 本 文 将 这 个 数据 
模型 进行 拆 分 并 分 别 进 行 分 析 。 


sg:hasJournal 、 


has Journal : has subject 


has fieid-of- 


——————————————————————————————— 


图 1 SciGraph 数据 模型 


Cn 
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Affiliation URI 
s 
sg:hasContribution 


rdf:type 
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sg:publishedGivenName 


sg:publishedFamilyNam 
sg:publishedName p 


人 


-7 


sg:isCorresponding 


sg:role 


«— — sg: scigraphld 


Contribution URI 


个 
sg:order sg:hasContribution 
sg:hasContribution 
sg 
has 
Fun 
ded 
rdf:type Pub 

~ lica 

sci sg:hasJournal ti 

sg: doi É P did dol.OTg/ 
sg:hasFieldOfResearchCode 

sg:languange 

L nai? 
sg: webpage 

« sg:title Org 

sg:titleTranslated http://dx.doi.org/ 
e : 

sg:abstract x.dol.OTg/ 

sg:publicationYear sg:publicationDate EE 


sg:abstractTraslated Pa 


sg:publicationYearMonth b 
v 


sg:volume 


Di TE 


实例 :CC D 外 部 链接 : I 


图 2 文章 数据 模型 


4.1 文章 数据 模型 

Springer Nature 为 文章 类 数据 模型 提供 
了 20 个 属性 ， 将 20 个 属性 分 为 类 型 、 标 识 
符 、 标 签 、 贡 献 者 、 出 版 商 、 主 题 信息 、 来 源 
6 类 。 使 用 rdf:type 表示 类 型 ; 标识 符 属性 包 
括 : scigraphId、 数 字 对 象 标识 符 (digital object 
identifier, DOI) 和 数字 对 象 标识 符 链接 ; 标签 
属性 包括 : 语种 、 题 名 、 翻 译 题名 、 摘 要 、 翻 
译 摘要 ; 出 版 商 信息 包括 : 出 版 年 、 出 版 年 月 、 出 
版 日 期 、Springer Nature 网 页 ; 主题 信息 包括 


| 


澳大利亚 与 新 西 兰 标准 研究 分 类 法 : 研究 领域 
( ANZSRC-FOR ) l"! 和 Springer Nature 自己 ££ 
立 的 主题 词 ; 来 源 信息 包括 期 刊 、 期 刊 卷 、 期 
刊 期 号 。 

在 各 属性 的 取 值 中 ， 与 Springer Nature 提 
供 的 贡献 者 、 资 助 数据 、 期 刊 、 主 题词 类 对 应 
的 实例 URI 进行 内 部 链接 ， 选 用 数字 对 象 标识 
符 系 统 提供 的 DOILINK 和 ANZSRC-FOR 提供 
的 分 类 号 作为 外 部 链接 ， 其 他 属性 值 取 值 为 文 
本 值 或 数值 ， 见 图 2。 
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Springer Nature 目前 并 没有 贡献 者 (con- 
tribution ) 的 数据 模型 。 但 是 从 其 发 布 的 N-Tri- 
ples"? 格式 的 三 元 组 数据 ， 可 知 贡 献 者 属性 有 
数据 类 型 、scigraphId、 对 外 公开 的 姓名 、 对 外 
公开 的 姓 、 对 外 公开 的 名 、 排 序 ( 文章 作者 排 
序 )、 是 否 为 通讯 作者 ( 属性 值 为 布尔 值 true 
ak false) 、 角 色 (PUEH “author” “editor” z% 
隶属 机 构 ( 为 
Springer Nature 提供 的 实体 ) P9. 
4.2 资助 数据 模型 

Springer Nature 为 资助 类 数据 模型 提供 了 
18 个 属性 ， 将 18 个 属性 分 为 类 型 、 标 识 符 、 标 
签 、 资 助 额 、 资 助 时 间 、 资 助 主体 、 其 他 6 类 。 
使 用 rdf:type 表示 类 型 ; 标识 符 属 性 为 资助 的 


NS 


[ de m 
sg:scigraphld 


< sg:fundingAmount 


sg:fundingCurrency 


"principal investigator" ) , 


< 一 


sg:language 


sg:title 


e a 


D: 


sg:abstract 


sg:abstractTranslated 


"1 l 


ution URI 
^ sg:hasFundedPublication 
sg:hasContribution 


sg:endYear 
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scigraphld; 标签 属性 包括 : 语种 、 题 名 、 翻 译 
题名 、 摘 要 、 翻 译 摘要 ; 资助 额 信息 包括 : 资 
助 金额 、 融 资 货币 ; 资助 时 间 包括 资助 开始 时 
间 、 资 助 结束 时 间 ; 资助 主体 包括 资助 组 织 、 被 
资助 组 织 ; 其 他 属性 包括 与 资助 相关 的 贡献 
者 、 资 助 的 研究 领域 分 类 号 、 资 助 的 出 版 物 、 许 
可 条 款 、 所 在 网 页 。 

在 各 属性 的 取 值 中 ， 与 Springer Nature 提 
供 的 与 资助 相关 的 贡献 者 、 资 助 的 出 版 物 文章 
对 应 的 实例 URI 进行 内 部 链接 ， 选 用 全 球 研 
究 标 识 符 数据 库 (global research identifier da- 
tabase, GRID ) "" 提供 资助 组 织 与 被 资助 组 织 
URI 和 ANZSRC-FOR 提供 的 分 类 号 作为 外 部 链 
接 , 其 他 属性 取 值 为 文本 值 或 数值 , 如 图 3 所 示 : 


sg:hasRecipientOrganization 


sg:hasFundingOrganization —— 


实例 : 


Es. 


4.3 期 刊 数 据 模型 

Springer Nature 为 期 刊 类 数据 模型 提供 了 8 
个 属性 ， 将 8 个 属性 分 为 类 型 、 标 识 符 、 所 属 
期 刊 品牌 、 格 式 、 是 否 为 正在 出 版 、 是 否 为 历 
史 期 刊 6 类 。 使 用 rdf:type 表示 类 型 ; 标识 符 属 
性 包括 为 期 刊 的 scigraphId、ISSN 号 、DOI; 使 


外 部 链接 : ip 文本 值 或 数值 : 


图 3 资助 数据 模型 


3& 


用 sg:hasJournalBrand 表示 所 属 期 刊 品牌 ; 格 
式 主要 指 期 刊 的 媒介 形式 ; 是 否 为 正在 出 版 用 
sg:isActivePublication 属性 表示 ; 是 否 有 历史 期 
刊 用 sg:isHistoricalJourna 表示 。 

在 各 属性 的 取 值 中 ， 与 Springer Nature 提 
供 的 与 期 刊 所 属 的 期 刊 品牌 、 出 版 在 期 刊 上 的 
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文章 对 应 的 实例 URI 进行 内 部 链接 ， 其 他 属性 
取 值 为 文本 值 或 数值 ， 其 中 期 刊 的 媒介 属性 文 
本 取 值 为 “Electronic” 和 “Paper (journals, nor- 
mal index)” , “是否 为 正在 出 版 期 刊 ” 和 “是 
否 为 历史 期 刊 ” 属性 取 值 均 为 为 布尔 值 “true” 或 

“false”， 见 图 4。 
从 Springer Nature 提供 的 期 刊 数据 模型 的 


Aricle URI 


rdf:type 


sg:scigraphId sg:hasJournal 


ChinaXiv 合 作 期 刊 


N-Triples 格式 的 三 元 组 数据 可 知 ， 期 刊 品牌 属 
性 有 数据 类 型 、scigraphId、 语 种 、 标 题 、 标 题 
简称 、 副 标题 、 版 本 说 明 、 出 版 商 、 知 识 产 权 
所 有 者 、 所 在 网 页 、 添 加 Springer Nature 数据 
库 的 日 期 、 创 建 年 代 、 结 束 年 代 、 开 始 卷 号 、 结 
RE, ER FPR (PUEN “Fully Open 
Access" mk "Hybrid (Open Choice)" ) . 


—T -一 到 


sg:doi sg:isActivePublication 


e iE Journal URI sg:isHistoricalJourn 
CTS 
sg:JournalBrand sg:hasJournalBrand 
N—id£type 
«—— sg:scigraphId V sienne > 
sg:language : 
JournalBrand URI sg:endYear 一 > 
«—— sgttitle sg:volumeStart —> 
sg:shortTitle sg:volumeEnd 
sg:subtitle sg;volumeCount 22 


sg:imprint 
sg:publisher 


[o 


sg:copyrightHolder 


sg:titleAddedYear 


sg:openAccess 
sg: webpage 


X5 CO 0 — 外 部 链接 : EL 文本 值 或 数值， 


图 4 期 刊 数据 模型 


4.4 主题 数据 模型 

Springer Nature 的 主题 主要 是 自己 网 站 建立 
的 主题 词 ， 主 要 分 为 生物 科学 、 地 球 与 环境 科 
学 、 生 命 科学 ,物理 科学 、 科 学 共同 体 与 社会 、 社 
会 科学 、 人 文科 学 、 商 务 贸易 、 弃 用 的 九 大 类 
主题 。Springer Nature 为 主题 数据 模型 提供 了 
16 个 属性 ， 将 16 个 属性 分 为 类 型 、 标 签 、 标 识 
符 、 参 照 、SKOS 表示 5 类 。 使 用 rdfitype 表示 
类 型 ; 使 用 rdfs:label 表示 标签 ; 标识 符 属性 为 
主题 的 Id 号 ; 参照 类 属性 包括 Springer Nature 


主题 词 之 间 的 相关 关系 、 替 代 关 系 ; SKOS 表示 
是 通过 SKOS 命名 空间 对 Springer Nature 主题 
词 进行 组 织 表 示 ， 包括 其 首选 词 、 非 首选 词 、 定 
义 、 注 释 、 范 于 注释 、 主 题词 所 属 主题 词 表 、 上 
下 位 关系 和 族 首 词 。 

在 各 属性 的 取 值 中 ， 与 Springer Nature 提 
供 的 相关 主题 词 、 替 代 主 题词 、 被 蔡 代 主题 词 
对 应 的 实例 URI 进行 内 部 链接 ; 并 通过 SKOS 
对 Springer Nature 的 主题 词 进行 组 织 ， 实 现 语 
义 表 示 ; 其 他 属性 取 值 均 为 文本 值 , 如 图 5 Bron: 
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sg:hasSubject 
i type IS uu T— Sg- T d 
S 
rdfs:label 
-7 
<—— sgid skos:prefLabel 
skos:altLabel 一 > 
sg:webpage skos:definition 
<o> < 和 一 | 一 ~、 
skos:note 


m broader Pi skos:topConceptOf EN 


skos:narrower 


| Y skos:scopeNote 
e o CGD CD ` 


实例 ， C 2 外 部 链接 ， <C > 


图 5 主题 


skos:inScheme 


文本 值 或 数值 : zr ) 


数据 模型 


ORDF 实现 


Springer Nature SciGraph 关联 开放 数据 
平台 目前 对 外 只 提供 了 N-Triples 格式 的 三 元 
组 ，N-Triples 是 用 于 RDF T 
化 ， 一 种 面向 行 的 格式 。 每 个 三 元 组 必须 写成 


一 个 独立 行 ， 它 由 主语 说 明 符 、 谓 语 说 明 符 以 
及 宾语 说 明 符 组 成 ， 后 面 还 有 一 个 句号 。 如 果 
它们 有 URI， 那 么 它们 用 尖 括 号 将 绝对 URI 引 
用 括 起 来 中。 截取 Springer Nature SciGraph 提 
供 的 有 关 主 题词 “genomics” 的 一 些 N-Triples 
格式 的 代码 ， 如 图 6 所 示 : 


<http://www. springernature. com/scigraph/things/subjects/genomics> 
<http://www. w3. org/1999/02/22-rdf-syntax-ns&type? 
http://www. springernature. com/scigraph/ontologies/core/Subject. 


<http://www. springernature. com/scigraph/things/subjects/genomics> 
<http://wwvw. w3. org/2000/01/rdf-schema#label> ^ GenomicsGen. 


<http://www. springernature. com/scigraph/things/subjects/genomics> 


<http://www. springernature. com/scigraph/ontologies/core/id> genomics 


<http://www. springernature. com/scigraph/things/subjects/genomics> 
<http://www. w3. org/2000/01/rdf-schema#isDefinedBy> 
<http://www. springernature. com/scigraph/things/subjects/>. 


<http://www. springernature. com/scigraph/things/subjects/genomics> 


<http://www. springernature. com/scigraph/ontologies/core/webpage> 
http://www. nature. com/sub jects/genomics. 


图 6 “genomics” 的 一 些 N-Triples 格式 的 关联 数据 
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@ 授 权 许可 


授权 许可 通过 明确 发 布 和 使 用 关联 数据 过 
程 中 的 各 项 法 律 问 题 ， 包 括 所 有 权 、 发 布 权 、 使 
用 权 、 收 益 权 等 ， 针 对 不 同 对 象限 定 不 同 的 权 
限 ， 构 建 合 理 利 用 关联 数据 的 保护 机 制 ， 以 达 
到 促进 数据 开放 、 保 证 开放 数据 安全 、 提 高 数 
据 重 用 性 的 目的 。 授 开放 许可 是 语义 网 环境 下 
关联 数据 能 够 真正 开放 并 长 久 发 展 的 必要 条 件 。 
授权 许可 通过 磐 和 数据 ， 使 得 用 户 在 访问 数据 
时 无 需 征 得 数据 发 布 者 的 许可 ， 授 权 许 可 包含 
了 用 户 被 许可 的 所 有 操作 和 未 被 许可 的 的 操 
作 。 目 前 已 有 的 授权 模型 有 : 免费 文献 许可 协议 
(GNU free documentation license)、 共 享 文件 许可 
协议 ( common documentation license)、 知 识 共 
享 许可 协议 (creative commons license) 等 ， 各 个 
协议 能 够 实现 对 不 同类 型 开放 数据 的 保护 。 

Springer Nature SciGraph 发 布 关联 数据 的 
目的 是 为 了 将 其 科研 数据 融入 关联 数据 网 络 
中 ,使 其 在 公共 领域 发 挥 作用 ， 因 而 选择 较为 
通用 的 知识 共享 许可 协议 作为 授权 许可 协议 。 
Springer Nature SciGraph 中 的 数据 是 在 署名 -JE 
商业 性 使 用 国际 4.0 (CC BY-NC 4.0) 授权 模型 
下 获取 的 中， 表示 允许 在 任何 媒介 以 任何 形式 
复制 、 发 行 本 作品 ， 并 允许 修改 、 转 换 或 以 本 
作品 为 基础 进行 创作 ， 但 不 能 将 本 作品 用 于 商 
业 目 的 后 。 通 过 dcterms: license 属性 表示 该 知 
识 共 享 协议 ， 属 性 值 为 https://creativecommons. 
org/licenses/by-nc/4.0/ 表示 对 数据 使 用 进行 授权 。 


@ 结 语 


Springer Nature SciGraph 关联 开放 数据 平 
台 的 推出 ， 是 出 版 领域 实现 关联 开放 科研 的 起 
点 。Springer Nature SciGraph 关联 开放 数据 的 
实现 ， 打 破 了 原 有 数据 组 织 结构 体系 ， 实 现 了 
数据 关联 、 互 操作 、 数 据 挖掘 等 功能 ， 从 概念 
角度 对 出 版 物 进行 描述 ， 通 过 对 Springer Nature 
SciGraph 关联 开放 数据 模型 的 分 析 ， 可 知 出 版 
社 作为 发 布 出 版 物 的 源头 ， 对 出 版 进行 语义 描 
述 对 于 实现 数据 互 操作 、 数 据 关联 有 着 重要 的 


ChinaXiv 合 作 期 刊 


意义 。 我 国 出 版 领域 应 借鉴 这 种 科研 出 版 物 实 
现 关 联 开放 模式 ， 通 过 详细 分 析 中 文 出 版 物 包 
含 的 实体 、 属 性 及 彼此 之 间 的 关系 ， 选 择 合适 
的 本 体 或 在 面 对 我 国 特 有 的 文献 ( 古籍、 拓片 
等 ) 时 构建 自己 的 本 体 ， 构 建 数据 模型 来 实现 
中 文 出 版 物 的 语义 描述 和 语义 出 版 ,同时 指定 
授权 许可 明确 数据 使 用 过 程 中 的 各 项 法 律 问题 。 
当然 实现 过 程 离 不 开 软 件 平台 的 使 用 ， 考 虑 到 
成 本 问题 和 不 同 出 版 社 之 间 数 据 的 互 操作 问 
题 ， 针 对 不 同 的 学 科 ， 考 虑 使 用 开源 软件 和 同 
一 学 科 下 的 出 版 社 之 间 采 用 统一 的 数据 模型 、 统 
一 的 词汇 表 来 实现 出 版 物 的 关联 开放 。 
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Abstract: [Purpose/significance] The analysis of thelinked open data provided by the Springer Nature 


SciGraph platform provides a reference for the domestic publishers to use the linked data to promote the 


practice of linked open research in the scholarly communication and the semantic publishing, and push 


forward the further development of the open scientific research movement. [Method/process]| This paper 


analyzed the entity objects, vocabularies and data models of the Springer Nature SciGraph platformin detail. 


[Result/conclusion] Springer Nature SciGraph represents the data by building its own ontology and using a 


simpler serialized format N-Triples triple for RDF.As one of the world's largest publishers, Springer Nature 


Linked Data will provide some references for other publishers to realize the linked research in the future. 
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